深度学习中的highway network、ResNet、Inception 您所在的位置:网站首页 highway network定义 深度学习中的highway network、ResNet、Inception

深度学习中的highway network、ResNet、Inception

#深度学习中的highway network、ResNet、Inception| 来源: 网络整理| 查看: 265

文章目录 概念 CNN演化 梯度消失 highway network 公式: 意义、好处 ResNet 动机、目的 模型 作用: Inception Inception v1模型 Inception V2-V3: Inception v4模型 不是特别清楚这三个流行且有用的模型(或者说层)的具体作用和使用方法。

概念 CNN演化

先引入一张CNN结构演化图: image

2012年AlexNet做出历史突破以来,直到GoogLeNet出来之前,主流的网络结构突破大致是网络更深(层数),网络更宽(神经元数)。所以大家调侃深度学习为“深度调参”,但是纯粹的增大网络的缺点:

参数太多,容易过拟合,若训练数据集有限; 网络越大计算复杂度越大,难以应用; 网络越深,梯度越往后穿越容易消失(梯度弥散),难以优化模型 梯度消失

我们都知道神经网络中会使用非线性变换。

一般会使用sigmoid函数,得到image,这个函数会把数据压缩到开区间(0,1),函数的图像如下:

image

可以看到,函数的两侧非常平滑,而且无限的接近0和1,仅仅是中间部分函数接近一条直线。

要知道,神经网络训练的方法是BP算法(反向传播)。BP算法的基础其实就是导数的链式法则,就是有很多乘法会连接在一起。

看sigmoid函数的图像知道了,值域最大是1,而且大多数值都被推向两侧饱和的区域,这些区域的导数很小。

可以预见到,随着网络的加深,梯度后向传播到输入层时,



【本文地址】

公司简介

联系我们

今日新闻

    推荐新闻

    专题文章
      CopyRight 2018-2019 实验室设备网 版权所有